Manipulation de données bibliométrique via {managHAL}

Martin AMIENS

MIA - Paris-Saclay

2024-04-07

Martin AMIENS

  • Stagiaire au sein de l’unité MIA - Paris-Saclay.
  • Etudiant en première année du master Bio-Informatique et Bio-Statistiques à Paris-Saclay.
  • Tuteurs : Julie AUBERT, Pierre BARBILLON

Contexte

  • DRIT : Direction des Recherches et de l’Innovation Technologique
  • Sciences Ouvertes : “est la diffusion sans entrave des publications et des données de la recherche.” (Webmestre,2021)
  • HAL : Hyper Articles en Ligne

Crédit : CCSDForge

::::

Objectifs du stage

  • Accessibilité et généricité de {managHAL}
  • Ajout de fonctionnalité à {managHAL}

Accessibilité et généricité de {managHAL}

Accessibilité et généricité de {managHAL}

faire un tibble des resultats obtenus avec quelques fonctions présentes dans le package (parler vite fait de pourquoi c’est générique (identifiant structure))

# A tibble: 3 × 13
  civilite nom       prenom statut rattachement  debut_contrat fin_contrat
  <chr>    <chr>     <chr>  <chr>  <chr>         <chr>         <chr>      
1 M.       ADJAKOSSA Éric   CEC    AgroParisTech ""            ""         
2 Mme      AUBERT    Julie  IR     INRAE         ""            ""         
3 M.       BARBILLON Pierre PR     AgroParisTech ""            ""         
# ℹ 6 more variables: financement <chr>, equipe <chr>, unite <chr>,
#   orcid <chr>, idhal <dbl>, adresse_mail <chr>
# A tibble: 1 × 11
    docid halId_s      version_i docType_s citationFull_s          citationRef_s
    <int> <chr>            <int> <chr>     <chr>                   <chr>        
1 4440523 hal-04440523         1 COMM      Isabelle Lebert, Maxim… Colloque fin…
# ℹ 5 more variables: publicationDate_tdate <chr>,
#   authFullNamePersonIDIDHal_fs <chr>, structAcronym_s <chr>,
#   structId_i <chr>, structHasAlphaAuthIdHalPersonid_fs <chr>
# A tibble: 1 × 1
  X.error..msg.Error..See.help.....docs..
  <lgl>                                  
1 NA                                     

Réseaux et modèle de graphe aléatoire

Expliquer tres brievement un reseau, montrer quelque exemples rapidement, puis fair eun parallèle vers la présentation de louis qui arrive apres. ::: {.notes} Un réseau d’interaction est constitué de nœuds (les entités) et d’arêtes (les liens entre ces entités). Dans le cadre du package {managHAl}, j’utiliserai les réseaux pour modéliser un réseau de co-publications (ou co-auteurs). Les noeuds représenteront des auteurs, et les arêtes entre ces noeuds (auteurs) seront l’existence de publications scientifiques co-écrite par les deux noeuds. La taille d’un nœud représentera le nombre de publications écrites par cet auteur (noeud) et la largeur d’une arête pourra correspondre au nombre de publications co-ecrites par les deux noeuds (co-auteurs). Les réseaux ne sont cependant pas exclusifs à l’analyse de données bibliométriques. En effet, les réseaux sont utilisés comme représentation et comme objet d’analyse statistique dans de nombreux domaines. Par exemple, des réseaux de régulations de gènes sont réalisés à partir de données de co-expression. Il est possible de donner d’autres exemples comme les analyses de réseaux d’interactions entre des espèces (réseau trophique) réalisées en écologie :::

Je veux faire une courte présentation des réseaux, et des modèles possible à partir de ces réseaux pour réaliser de l’analyse statistique de réseaux.

peut etre mettre des exemples de réseaux classiques genre trophique, … etc

# Création d'un réseau unipartite
set.seed(42) # Pour la reproductibilité 
unipartite <- erdos.renyi.game(10, 0.3)
unipartite_graph <- plot(unipartite, main = "Réseau Unipartite")

Réseaux et modèle de graphe aléatoire

Ajout de fonctionnalité à {managHAL}

montrer la construction d’un réseau à partir des données (mettre l’interactif, le grand et le petit l’un après l’autre)

Ajout de fonctionnalité à {managHAL}

dire qu’il est possible de réaliser des modèles à partir de ces données (sans expliquer), juste une phrase sur on regroupe les noeuds par profils de connexion similaire. Montrer les deux graphes obtenus avec couleur via sbm.

Discussion, Perspectives et avenir du package

parler des limitations vu par rapport aux quatres graphes précédents, comment je peux les régler (analyses sur composantes connexe), parler du développement du package et de ce qui sera disponible, la finalité du stage.

Merci de m’avoir écouté

Questions ?

Méthodes informatiques

ne faire que si j’ai le temps, les mettres dans les diapos de questions possible ? parler version Rstudio, package utilisés, explication de …

quelles sont les questions qui peuvent venir au cours de ma présentation,

quelles sont les choses dont je n’ai pas parlé au cours de ma présentation,

sources

https://www.ouvrirlascience.fr/plan-national-pour-la-science-ouverte/